Analisi bibliometrica - I docenti del DMIF

logo

Introduzione

Che cosa è la bibliometria?

La bibliometria è una disciplina che utilizza analisi quantitative e statistiche per analizzare le pubblicazioni scientifiche e le loro relazioni.

Il progetto si focalizza sull’analisi della produzione scientifica dei docenti del dipartimento DMIF dell’Università degli Studi di Udine, per cercare di dare una stima di:

  • come funziona la ricerca

  • quali sono i settori di maggiore interesse

  • gli autori più prolifici.

Per supporto all’analisi ho utilizzato una libreria, Bibliometrix (Aria and Cuccurullo 2017), sviluppata da due docenti dell’Università di Napoli.

Fonte dei dati

I dati analizzati in questo progetto sono stati scaricati (ultimo download: 12/02/2024) da Scopus, uno dei principali dabatase bibliografici. E’ stata selezionata la sottoarea della computer science e da successivamente sono stati selezionati 31 autori del DMIF, tra docenti e dottorandi.

Ogni articolo del dataframe contiene svariati attributi tra cui: la lista di autori, il titolo del documento, la sorgente di pubblicazione, il tipo di documento, le parole chiavi degli autori, le references, il numero di citazioni, l’anno di pubblicazione.

Analisi bibliometrica

Analisi descrittiva del dataframe

La tabella delle informazioni principali descrive le dimensioni della raccolta in termini di numero di documenti, numero di autori, numero di fonti, numero di parole chiave, durata e numero medio di citazioni.

  • “docs per autori” è calcolato come rapporto tra il numero totale di autori e il numero totale di articoli.

  • “co-autori per articolo” è calcolato come numero medio di co-autori per articolo.



MAIN INFORMATION ABOUT DATA

 Timespan                              1987 : 2024 
 Sources (Journals, Books, etc)        386 
 Documents                             1251 
 Annual Growth Rate %                  5.78 
 Document Average Age                  11 
 Average citations per doc             13.63 
 Average citations per year per doc    1.157 
 References                            28512 
 
DOCUMENT CONTENTS
 Keywords Plus (ID)                    6244 
 Author's Keywords (DE)                1972 
 
AUTHORS
 Authors                               1012 
 Author Appearances                    4233 
 Authors of single-authored docs       17 
 
AUTHORS COLLABORATION
 Single-authored docs                  77 
 Documents per Author                  1.24 
 Co-Authors per Doc                    3.38 
 International co-authorships %        32.93 
 

Annual Scientific Production

 Year    Articles
    1987        1
    1988        1
    1989        1
    1990        1
    1991        3
    1993        4
    1994        5
    1995       12
    1996        7
    1997       10
    1998       11
    1999        9
    2000       15
    2001       17
    2002       25
    2003       23
    2004       44
    2005       29
    2006       35
    2007       49
    2008       54
    2009       60
    2010       46
    2011       44
    2012       40
    2013       32
    2014       50
    2015       58
    2016       55
    2017       60
    2018       85
    2019       59
    2020       73
    2021       62
    2022       76
    2023       87
    2024        8

Annual Percentage Growth Rate 5.78 


Most Productive Authors

   Authors        Articles Authors        Articles Fractionalized
1    MONTANARI A       196  CHITTARO L                       77.7
2    CHITTARO L        161  MONTANARI A                      57.5
3    MIZZARO S         130  MIZZARO S                        41.0
4    DOVIER A          118  POLICRITI A                      39.8
5    POLICRITI A       109  DOVIER A                         39.8
6    MICULAN M          83  MICULAN M                        37.4
7    PIAZZA C           81  PIAZZA C                         26.6
8    PICIARELLI C       57  LANCIA G                         26.1
9    FORESTI GL         56  FRANCESCHET M                    22.3
10   FONTANA F          55  BRAJNIK G                        21.2
11   LANCIA G           55  FONTANA F                        17.4
12   PONTELLI E         55  FORMISANO A                      17.2
13   FORMISANO A        54  PICIARELLI C                     16.8
14   SALA P             52  PONTELLI E                       15.3
15   SCIAVICCO G        52  FORESTI GL                       15.3


Top manuscripts per citations

                                        Paper                                    DOI  TC TCperYear   NTC
1  CORNIA M, 2018, IEEE TRANS IMAGE PROCESS            10.1109/TIP.2018.2851672      385     55.00 26.76
2  CHITTARO L, 2007, COMPUT EDUC                       10.1016/j.compedu.2005.06.002 286     15.89 11.90
3  BUTTUSSI F, 2018, IEEE TRANS VISUAL COMPUT GRAPHICS 10.1109/TVCG.2017.2653117     276     39.43 19.18
4  CHITTARO L, 2015, IEEE TRANS VISUAL COMPUT GRAPHICS 10.1109/TVCG.2015.2391853     250     25.00 15.76
5  CHITTARO L, 2006, COMPUTER                          10.1109/MC.2006.109           248     13.05  7.72
6  NADALIN F, 2012, BMC BIOINFORM                      10.1186/1471-2105-13-S14-S8   245     18.85 13.74
7  PICIARELLI C, 2006, PATTERN RECOGN LETT             10.1016/j.patrec.2006.02.004  218     11.47  6.79
8  JENSEN CS, 1998, LECT NOTES COMPUT SCI              10.1007/bfb0053710            218      8.07  4.52
9  FRANCESCHET M, 2010, J INF                          10.1016/j.joi.2010.06.003     182     12.13  6.45
10 FRANCESCHET M, 2010, SCIENTOMETRICS                 10.1007/s11192-009-0021-2     172     11.47  6.10
11 FRANCESCHET M, 2011, COMMUN ACM                     10.1145/1953122.1953146       137      9.79  6.72
12 MIZZARO S, 1998, INTERACT COMPUT                    10.1016/S0953-5438(98)00012-5 136      5.04  2.82
13 BUTTUSSI F, 2008, ARTIF INTELL MED                  10.1016/j.artmed.2007.11.004  127      7.47  7.45
14 BURIGAT S, 2007, INT J HUM COMPUT STUD              10.1016/j.ijhcs.2007.07.003   123      6.83  5.12
15 DOVIER A, 2004, THEOR COMPUT SCI                    10.1016/S0304-3975(03)00361-X 117      5.57  5.11


Corresponding Author's Countries

          Country Articles    Freq SCP MCP MCP_Ratio
1  ITALY               630 0.87866 499 131     0.208
2  SWITZERLAND          12 0.01674   0  12     1.000
3  UNITED KINGDOM       11 0.01534   0  11     1.000
4  USA                   9 0.01255   0   9     1.000
5  SPAIN                 8 0.01116   0   8     1.000
6  DENMARK               7 0.00976   0   7     1.000
7  FRANCE                6 0.00837   0   6     1.000
8  MEXICO                5 0.00697   0   5     1.000
9  NETHERLANDS           5 0.00697   0   5     1.000
10 FINLAND               3 0.00418   0   3     1.000
11 ICELAND               3 0.00418   0   3     1.000
12 AUSTRALIA             2 0.00279   0   2     1.000
13 AUSTRIA               2 0.00279   0   2     1.000
14 CYPRUS                2 0.00279   0   2     1.000
15 GERMANY               2 0.00279   0   2     1.000


SCP: Single Country Publications

MCP: Multiple Country Publications


Total Citations per Country

     Country      Total Citations Average Article Citations
1  ITALY                    10704                     16.99
2  DENMARK                    224                     32.00
3  USA                        206                     22.89
4  UNITED KINGDOM             195                     17.73
5  SPAIN                      112                     14.00
6  FRANCE                      91                     15.17
7  MEXICO                      80                     16.00
8  SOUTH AFRICA                64                     64.00
9  CYPRUS                      63                     31.50
10 NETHERLANDS                 57                     11.40
11 FINLAND                     37                     12.33
12 AUSTRALIA                   34                     17.00
13 SWITZERLAND                 30                      2.50
14 ICELAND                     22                      7.33
15 POLAND                      22                     11.00


Most Relevant Sources

                                                                                                                         Sources       
1  LECTURE NOTES IN COMPUTER SCIENCE (INCLUDING SUBSERIES LECTURE NOTES IN ARTIFICIAL INTELLIGENCE AND LECTURE NOTES IN BIOINFORMATICS)
2  CEUR WORKSHOP PROCEEDINGS                                                                                                           
3  THEORETICAL COMPUTER SCIENCE                                                                                                        
4  LEIBNIZ INTERNATIONAL PROCEEDINGS IN INFORMATICS LIPICS                                                                             
5  ACM INTERNATIONAL CONFERENCE PROCEEDING SERIES                                                                                      
6  ELECTRONIC PROCEEDINGS IN THEORETICAL COMPUTER SCIENCE EPTCS                                                                        
7  ELECTRONIC NOTES IN THEORETICAL COMPUTER SCIENCE                                                                                    
8  EURO ADVANCED TUTORIALS ON OPERATIONAL RESEARCH                                                                                     
9  INFORMATION AND COMPUTATION                                                                                                         
10 INTERNATIONAL JOURNAL OF HUMAN COMPUTER STUDIES                                                                                     
11 COMMUNICATIONS IN COMPUTER AND INFORMATION SCIENCE                                                                                  
12 THEORY AND PRACTICE OF LOGIC PROGRAMMING                                                                                            
13 FUNDAMENTA INFORMATICAE                                                                                                             
14 JOURNAL OF LOGIC AND COMPUTATION                                                                                                    
15 SPRINGERBRIEFS IN COMPUTER SCIENCE                                                                                                  
   Articles
1       245
2       115
3        31
4        28
5        26
6        25
7        24
8        16
9        15
10       14
11       13
12       13
13       12
14       10
15       10


Most Relevant Keywords

   Author Keywords (DE)      Articles         Keywords-Plus (ID)     Articles
1   EVALUATION                     30 COMPUTER CIRCUITS                   121
2   MODEL CHECKING                 26 SEMANTICS                            99
3   MOBILE DEVICES                 24 LOGIC PROGRAMMING                    96
4   VIRTUAL REALITY                24 TEMPORAL LOGIC                       95
5   INTERVAL TEMPORAL LOGIC        21 ARTIFICIAL INTELLIGENCE              91
6   CROWDSOURCING                  18 INFORMATION RETRIEVAL                71
7   DEEP LEARNING                  18 AUTOMATA THEORY                      68
8   COMPLEXITY                     17 INTERVAL TEMPORAL LOGIC              67
9   DECIDABILITY                   15 ALGORITHMS                           64
10  BISIMULATION                   14 COMPUTABILITY AND DECIDABILITY       61
11  MACHINE LEARNING               14 MODEL CHECKING                       60
12  ANSWER SET PROGRAMMING         13 COMPUTER SCIENCE                     55
13  COMPUTATIONAL COMPLEXITY       13 VIRTUAL REALITY                      55
14  TREC                           13 FORMAL LOGIC                         52
15  TRAINING                       12 COMPUTATION THEORY                   50

Prof. Montanari autore più produttivo con 196 articoli

Italia paese più produttivo, alcuni autori erano in altri paesi (esempio Svizzera, UK) quando hanno pubblicato

anno più produttivo: 2023 con 87 pubblicazioni

anno con media citazioni in articoli più alta: 2018

anno con più citazioni: 1987

Documenti per tipo

                 DT   n
1  CONFERENCE PAPER 703
2           ARTICLE 446
3      BOOK CHAPTER  41
4         EDITORIAL  40
5            REVIEW  15
6           ERRATUM   2
7              BOOK   1
8        DATA PAPER   1
9              NOTE   1
10     SHORT SURVEY   1

Il tipo di pubblicazione più presente è il conference paper, seguito da articoli e capitoli di libro.

Analisi dei riferimenti citati

Possiamo analizzare la frequenza dei riferimenti/primi autori più citati nel dataset in analisi.

Papers citati più frequentemente:

                                                                                                                                                                                                                         [,1]
MOSZKOWSKI B., REASONING ABOUT DIGITAL CIRCUITS, (1983)                                                                                                                                                                    36
ALLEN J.F., MAINTAINING KNOWLEDGE ABOUT TEMPORAL INTERVALS, COMMUNICATIONS OF THE ACM, 26, 11, PP. 832-843, (1983)                                                                                                         32
BRESOLIN D., GORANKO V., MONTANARI A., SCIAVICCO G., PROPOSITIONAL INTERVAL NEIGHBORHOOD LOGICS: EXPRESSIVENESS, DECIDABILITY, AND UNDECIDABLE EXTENSIONS, ANNALS OF PURE AND APPLIED LOGIC, 161, 3, PP. 289-304, (2009)   25
VENEMA Y., A MODAL LOGIC FOR CHOPPING INTERVALS, JOURNAL OF LOGIC AND COMPUTATION, 1, 4, PP. 453-476, (1991)                                                                                                               25
HALPERN J., SHOHAM Y., A PROPOSITIONAL MODAL LOGIC OF TIME INTERVALS, JOURNAL OF THE ACM, 38, 4, PP. 935-962, (1991)                                                                                                       23
VENEMA Y., EXPRESSIVENESS AND COMPLETENESS OF AN INTERVAL TENSE LOGIC, NOTRE DAME JOURNAL OF FORMAL LOGIC, 31, 4, PP. 529-547, (1990)                                                                                      23
HALPERN J.Y., SHOHAM Y., A PROPOSITIONAL MODAL LOGIC OF TIME INTERVALS, JOURNAL OF THE ACM, 38, 4, PP. 935-962, (1991)                                                                                                     21
HILLSTON J., A COMPOSITIONAL APPROACH TO PERFORMANCE MODELLING, (1996)                                                                                                                                                     18
ALLEN J.F., MAINTAINING KNOWLEDGE ABOUT TEMPORAL INTERVALS, COMMUN. ACM, 26, 11, PP. 832-843, (1983)                                                                                                                       17
BRESOLIN D., MONTANARI A., SCIAVICCO G., AN OPTIMAL DECISION PROCEDURE FOR RIGHT PROPOSITIONAL NEIGHBORHOOD LOGIC, JOURNAL OF AUTOMATED REASONING, 38, 1-3, PP. 173-199, (2007)                                            16

Vediamo che 2 articoli del Professor Montanari sono tra i più citati.

Primi autori citati più frequentemente:

            [,1]
MONTANARI A 1100
ET AL        980
SCIAVICCO G  449
DOVIER A     409
MIZZARO S    393
POLICRITI A  380
SALA P       380
CHITTARO L   357
PONTELLI E   348
BRESOLIN D   345
GORANKO V    292
MICULAN M    279
PIAZZA C     253
PERON A      242
MOLINARI A   198

Vediamo che gli autori più frequentemente citati sono Prof. Montanari, Prof. Dovier, Prof. Mizzaro e Prof. Policriti.

Classifica di dominanza degli autori

La funzione dominanza calcola la classifica di dominanza degli autori come proposto da Kumar & Kumar, 2008.

Il fattore di dominanza è un rapporto che indica la frazione di articoli con più autori in cui uno studioso compare come primo autore.

         Author Dominance Factor Tot Articles Single-Authored Multi-Authored First-Authored Rank by Articles Rank by DF
1    CHITTARO L       0.54609929          161              20            141             77                2          1
2      DOVIER A       0.34210526          118               4            114             39                4          2
3  PICIARELLI C       0.28571429           57               1             56             16                8          3
4     FONTANA F       0.28301887           55               2             53             15               10          4
5     MICULAN M       0.24358974           83               5             78             19                6          5
6   MONTANARI A       0.13846154          196               1            195             27                1          6
7   POLICRITI A       0.12962963          109               1            108             14                5          7
8      PIAZZA C       0.11111111           81               0             81              9                7          8
9     MIZZARO S       0.09600000          130               5            125             12                3          9
10   FORESTI GL       0.07142857           56               0             56              4                9         10

Notiamo che nessuno è stato primo autore di tutti gli articoli pubblicati.

H-index degli autori

L’h-index è una metrica a livello di autore che cerca di misurare sia la produttività che l’impatto citazionale delle pubblicazioni.

L’indice si basa sull’insieme degli articoli più citati dello scienziato e sul numero di citazioni ricevute in altre pubblicazioni. L’indice è strutturato per quantificare mediante un singolo indice numerico non solo la produzione, ma anche l’influenza di uno scienziato, distinguendolo da chi avesse pubblicato molti articoli ma di scarso interesse.

Quindi uno scienziato ha un indice n se almeno n lavori tra quelli che ha pubblicato sono stati citati almeno n volte ciascuno.

L’indice è definito in modo tale che sull’insieme dato di articoli, ordinati in ordine decrescente di citazioni ricevute, il valore dell’indice-g è assegnato quando i primi g articoli hanno ricevuto cumulativamente \(g^2\) citazioni. \[g^2 \leq \sum_{i \leq g} c_i\]

L’ M-index è definito come h/n, dove h è l’ H-index e n è il numero di anni trascorsi dalla prima pubblicazione del ricercatore.

H-index dei primi 10 autori più produttivi (in questa raccolta):

        Element h_index g_index   m_index   TC  NP PY_start
1    CHITTARO L      39      63 1.1470588 4684 161     1991
2   MONTANARI A      22      35 0.6875000 2058 196     1993
3     MIZZARO S      20      33 0.7142857 1362 130     1997
4   POLICRITI A      19      35 0.5428571 1552 109     1990
5      DOVIER A      18      29 0.6666667 1197 118     1998
6     MICULAN M      16      23 0.5161290  695  83     1994
7  PICIARELLI C      16      28 0.8000000  901  57     2005
8      PIAZZA C      15      27 0.6000000  854  81     2000
9    FORESTI GL      14      27 0.7000000  822  56     2005
10    FONTANA F       8      12 0.5333333  245  55     2010

Gli autori con l’H-index più alto sono i Prof. Chittaro, Prof. Montanari e Prof. Mizzaro.

Produttività dei Top-Autori nel tempo

Calcolo e tracciamento della produzione degli autori (in termini di numero di pubblicazioni e di citazioni totali all’anno) nel tempo.

Notiamo che nel 2017 il Professor Mizzaro ha pubblicato ben 19 articoli.

     Author year freq  TC TCpY
1 MIZZARO S 2017   19 140 17.5

Stima dei coefficienti della Legge di Lotka

La legge di Lotka descrive la frequenza di pubblicazione degli autori in un determinato campo come una legge quadratica inversa, in cui il numero di autori che pubblicano un certo numero di articoli è un rapporto fisso rispetto al numero di autori che pubblicano un singolo articolo.

Significa quindi che pochi autori contribuiscono alla maggior parte dei lavori e molti o la maggior parte di essi contribuiscono a poche pubblicazioni.

Sia \(X\) il numero di pubblicazioni, \(Y\) il numero di autori con \(X\) pubblicazioni e \(\beta\) una costante che dipende dal campo specifico. La legge di Lotka afferma che \(Y \propto X^{- \beta}\).

Nella pubblicazione originale Lotka sosteneva che \(\beta=2\). Ricerche successive hanno dimostrato che \(\beta\) varia a seconda della disciplina.

Viene stimato il coefficiente \(\beta\) della collezione bibliografica e valutata, attraverso un test statistico, la somiglianza di questa distribuzione empirica con quella teorica.

   N.Articles N.Authors        Freq
1           1       645 0.637351779
2           2       134 0.132411067
3           3        51 0.050395257
4           4        36 0.035573123
5           5        19 0.018774704
6           6        14 0.013833992
7           7         9 0.008893281
8           8        12 0.011857708
9           9        11 0.010869565
10         10        12 0.011857708

La tabella mostra la distribuzione osservata della produttività scientifica. Notiamo che già dopo i primi 8 la legge non vale.

Coefficiente beta:

[1] 1.132216

Bontà di adattamento:

[1] 0.7852343

P-value test a due campioni:

[1] 0.000000000001162181

Il coefficiente Beta stimato è 1,13, con una bontà di adattamento pari a 0,78. Il test di Kolmogorov-Smirnoff (utilizzato per confrontare un campione con una distribuzione di riferimento) a due campioni fornisce un valore di 0.000000000001162181 che significa che c’è una differenza significativa tra la distribuzione osservata e quella teorica di Lotka.

Confronto graficamente le due distribuzioni:

Matrici di rete bibliografica

Gli attributi del paper sono collegati tra loro attraverso il paper stesso: autore/i alla rivista, parole chiave alla data di pubblicazione, ecc. Alcune delle analisi descrittive viste in precedenza si possono visualizzare attraverso reti bipartite.

Reti bipartite

Queste connessioni di diversi attributi generano reti bipartite che possono essere rappresentate come matrici rettangolari (Papers x Attributi).

Rete Paper x Fonte di pubblicazione:

L’oggetto è una matrice binaria rettangolare che rappresenta una rete bipartita in cui le righe e le colonne sono, in questo caso, rispettivamente papers e fonti.

L’elemento generico \(bip_{ij}\) è 1 se il paper i è stato pubblicato nella fonte j, 0 altrimenti.

La somma della colonna j-esima \(bip_j\) rappresenta il numero di papers pubblicati nella fonte j.

Fonti di pubblicazione più rilevanti:

LECTURE NOTES IN COMPUTER SCIENCE (INCLUDING SUBSERIES LECTURE NOTES IN ARTIFICIAL INTELLIGENCE AND LECTURE NOTES IN BIOINFORMATICS) 
                                                                                                                                 245 
                                                                                                           CEUR WORKSHOP PROCEEDINGS 
                                                                                                                                 115 
                                                                                                        THEORETICAL COMPUTER SCIENCE 
                                                                                                                                  31 
                                                                            LEIBNIZ INTERNATIONAL PROCEEDINGS IN INFORMATICS, LIPICS 
                                                                                                                                  28 
                                                                                      ACM INTERNATIONAL CONFERENCE PROCEEDING SERIES 
                                                                                                                                  26 

Rete degli autori: paper x autore, conta quanti articoli fatti da autori

MONTANARI A  CHITTARO L   MIZZARO S    DOVIER A POLICRITI A 
        196         161         130         118         109 

Accoppiamento bibliografico - autori

Le pubblicazioni scientifiche contengono riferimenti ad altri lavori scientifici. Questo genera un’altra rete, quella delle reti di accoppiamento o co-citazioni.

Due autori sono accoppiati bibliograficamente se almeno una fonte citata compare nelle loro pubblicazioni.

Rete di accoppiamento: \[B = A\cdot A^T\] dove A è una rete bipartita. Due autori sono collegati da un arco nella rete se citano insieme uno o più documenti.

L’elemento \(b_{i,j}\) indica quanti accoppiamenti bibliografici esistono tra i e j. La forza dell’accoppiamento di due autori, i e j, è definita dal numero di riferimenti che gli autori hanno in comune.

L’accoppiamento bibliografico tra autori è una misura di quanto due autori condividono riferimenti comuni nelle loro pubblicazioni. In altre parole, quanti autori citano gli stessi lavori nelle loro ricerche.

Analisi della rete

Il nodo più centrale della rete risulta essere il Professor Chittaro, con i valori più alti di tutti in queste tre metriche (ma non il grado) 1.

Il secondo nodo più centrale è il Professor Montanari, il quale ha il secondo valore più alto nelle tre metriche e il grado più alto.

Il Professor Sciavicco si posiziona in alto per la betweenness centrality, indicando un ruolo di ponte tra diverse comunità di autori.

           vertex cluster btw_centrality clos_centrality pagerank_centrality
4        dovier a       1     5.93614719      0.03333333          0.05018926
5     policriti a       1     1.13648296      0.03125000          0.04440508
7        piazza c       1     4.98330836      0.03333333          0.04987707
11     pontelli e       1     5.02023810      0.03225806          0.04775414
12    formisano a       1     0.44835165      0.02857143          0.03713586
13         sala p       1     0.23168498      0.02941176          0.03938667
14    sciavicco g       1    10.18687979      0.03571429          0.05558548
18        peron a       1     0.48926074      0.03030303          0.04183544
19     bresolin d       1     0.23168498      0.02941176          0.03938667
20     bozzelli l       1     0.07142857      0.02857143          0.03697284
21 della monica d       1     1.13648296      0.03125000          0.04440508
23     molinari a       1     0.48926074      0.03030303          0.04183544
24      monica dd       1     3.59759407      0.03225806          0.04725540
25      goranko v       1     0.90479798      0.02941176          0.03960194
3       mizzaro s       2     6.67976190      0.02857143          0.04099937
8    piciarelli c       2     0.49682540      0.02439024          0.02461762
9      foresti gl       2     6.12301587      0.02631579          0.03510770
15      roitero k       2     3.28809524      0.02702703          0.03534667
16    scagnetto i       2     0.11111111      0.02325581          0.01909874
17        serra g       2     3.08690476      0.02631579          0.03279471
22    demartini g       2     0.10000000      0.02272727          0.01668790
1     montanari a       3    20.84640360      0.03846154          0.06179634
2      chittaro l       3    48.31068931      0.04000000          0.06733006
6       miculan m       3     6.09358974      0.02857143          0.03912209
10      fontana f       4     0.00000000      0.02173913          0.01147244


Main statistics about the network

 Size                                  1012 
 Density                               0.014 
 Transitivity                          0.344 
 Diameter                              5 
 Degree Centralization                 0.176 
 Average path length                   2.906 
 

Densità: indica una rete sparsa.

Transitività: livello di clustering moderato.

Centralizzazione del grado: misura la concentrazione dei collegamenti nella rete, significa che la distribuzione dei gradi non è completamente uniforme, con alcuni autori che hanno un numero di collegamenti significativamente maggiore rispetto ad altri.

Lunghezza media dei percorsi: molto breve.

Co-citazione bibliografica

Si parla di co-citazione di due articoli quando entrambi sono citati in un terzo articolo. La co-citazione è la frequenza con cui due documenti sono citati insieme da altri documenti.

Rete di co-citazione: \[C=A^T \cdot A\] dove A è una rete bipartita. Due documenti sono collegati da un arco nella rete se sono citati insieme in uno o più documenti.

In altre parole, l’elemento diagonale \(c_i\) è il numero di citazioni locali del riferimento i. L’elemento \(c_{i,j}\) rappresenta quante volte i documenti \(i\) e \(j\) sono stati co-citati insieme.

Analisi della rete

Il nodo con la centralità di Betweennees più alta è Allen j.f. 1983-1, con 361.6. Il nodo con la centralità di PageRank più alta è Moszkowski b. 1983, con 0.0414.

L’analisi evidenzia la presenza di diverse comunità di ricerca con interessi tematici specifici.

La centralità degli autori varia a seconda del cluster di appartenenza e delle metriche considerate.

Alcuni autori, come Moszkowski b. 1983, Allen j.f. 1983-1, Halpern j.y. 1991-1, Bresolin d. 2009 e Venema y. 1991 presentano valori di centralità più alti rispetto ad altri, suggerendo un ruolo potenzialmente più rilevante nella rete.

                    Node Cluster Betweenness   Closeness    PageRank
1       clarke e.m. 1999       1 210.0000000 0.003663004 0.020397457
2    lafferriere g. 2000       1   0.0000000 0.003246753 0.031485284
3         tarski a. 1951       1   0.0000000 0.003246753 0.030037538
4           alur r. 1994       1 286.5000000 0.005617978 0.026729357
5               ghosh r.       1   0.0000000 0.003246753 0.024420484
6       rogers r.w. 1983       2   0.0000000 0.100000000 0.024212573
7        bandura a. 1997       2   0.0000000 0.100000000 0.021968922
8         fogg b.j. 2003       2   0.0000000 0.100000000 0.017648292
9     moszkowski b. 1983       3  98.3727315 0.005681818 0.041478590
10     allen j.f. 1983-1       3 361.6044508 0.006493506 0.033151916
11        venema y. 1990       3  29.3785991 0.005494505 0.026168383
12   halpern j.y. 1991-1       3   1.4930439 0.005154639 0.025345642
13     allen j.f. 1983-2       3   0.0000000 0.002976190 0.018094210
14  marcinkowski j. 2014       3   4.9413324 0.005263158 0.025329854
15   halpern j.y. 1991-2       3   0.0000000 0.002976190 0.016298794
16           molinari a.       3   3.5243186 0.005208333 0.025682541
17      molinari a. 2016       3   0.9708447 0.005154639 0.013607977
18    molinari a. 2015-1       3   2.8200446 0.005208333 0.023053104
19    bresolin d. 2014-1       3   0.0000000 0.002941176 0.011801651
20    bresolin d. 2014-2       3   0.8644189 0.005154639 0.019314653
21      lomuscio a. 2014       3   1.4144450 0.005154639 0.021800866
22    molinari a. 2015-2       3   2.1157705 0.005208333 0.021604896
23    muscettola n. 1994       4 144.0000000 0.006024096 0.015295009
24 cialdea mayer m. 2016       4 144.0000000 0.006024096 0.015295009
25      bresolin d. 2009       5 237.5879882 0.006172840 0.030211943
26        venema y. 1991       5  50.0520001 0.005882353 0.028459575
27       halpern j. 1991       5  23.5834095 0.005617978 0.026955112
28      bresolin d. 2007       5   9.6783785 0.005617978 0.021757428
29       goranko v. 2003       5   4.0171131 0.005555556 0.021397753
30          otto m. 2001       5   2.8795630 0.005555556 0.018367399
31       goranko v. 2004       5   3.0559092 0.005617978 0.018573971
32         allen j. 1983       5   0.0000000 0.002994012 0.007995417
33     blackburn p. 2002       5   1.9459772 0.005555556 0.013432717
34      bresolin d. 2010       5   9.1996612 0.005813953 0.011253145
35      hillston j. 1996       6 137.0000000 0.003076923 0.036147636
36            honsell f.       7   0.0000000 1.000000000 0.021276596
37         aczel p. 1988       8   0.0000000 0.003003003 0.006436220
38         baral c. 2003       9   2.0000000 0.250000000 0.031670335
39        milner r. 1989      10   0.0000000 0.002770083 0.008613635
40    saraswat v.a. 1993      11   0.0000000 0.002777778 0.022559520
41             dovier a.      12   0.0000000 0.166666667 0.010882856
42       miculan m. 1997      13   0.0000000 1.000000000 0.021276596
43       alzetta g. 2018      14   0.0000000 0.002770083 0.014035780
44        jaffar j. 1994      15   0.0000000 0.166666667 0.010882856
45      marriott k. 1998      16   2.0000000 0.250000000 0.031670335
46         paige r. 1987      17 191.0000000 0.003367003 0.013360655
47   wilkinson d.j. 2006      18   0.0000000 0.002777778 0.022559520


Main statistics about the network

 Size                                  28248 
 Density                               0.002 
 Transitivity                          0.874 
 Diameter                              24 
 Degree Centralization                 0.025 
 Average path length                   7.712 
 

Densità: indica una rete molto sparsa, la maggior parte delle possibili connessioni tra nodi non esiste, comune nelle reti di co-citazione perché non tutti gli autori citano tutti gli altri autori.

Transitività: valore molto alto, suggerisce la presenza di comunità di ricerca ben definite, dove gli autori tendono a citare altri autori appartenenti alla stessa comunità.

Centralizzazione del grado: misura la concentrazione dei collegamenti nella rete, il valore basso ottenuto indica che i collegamenti sono distribuiti più uniformemente tra i nodi. Questo è coerente con la bassa densità della rete, dove nessun nodo detiene la maggior parte delle connessioni.

Lunghezza media dei percorsi: breve.

Collaborazione autori

La rete di collaborazione scientifica è una rete in cui i nodi sono gli autori e i legami sono le coautorialità, in quanto quest’ultima è una delle forme più documentate di collaborazione scientifica (Glanzel, 2004).

Una rete di collaborazione tra autori può essere ottenuta utilizzando la formulazione generale: \[AC=A^T \cdot A\] dove A è una rete bipartita Papers x Autori.

L’elemento diagonale \(ac_i\) è il numero di papers di cui il ricercatore \(i\) è autore o coautore.

Sono presenti 4 clusters ed in ognuno di essi è presente almeno un nodo con dei valori alti di centralità, il che indica un ruolo di connessione e influenza all’interno del cluster.

  • cluster 1: Prof. Chittaro e Prof. Serra

  • cluster 2: Prof. Dovier e Prof. Policriti

  • cluster 3: Prof. Montanari

  • cluster 4: Prof. Mizzaro e Prof. Della Mea

         vertex cluster btw_centrality clos_centrality pagerank_centrality
2    chittaro l       1    104.0937022      0.01724138          0.04010246
6     miculan m       1     27.7710751      0.01449275          0.02774521
8  piciarelli c       1      2.5277778      0.01234568          0.02740807
9    foresti gl       1     40.7595238      0.01538462          0.05193366
10    fontana f       1      2.0000000      0.01098901          0.01837675
17  scagnetto i       1     33.0877675      0.01470588          0.03271515
18      serra g       1     81.8256989      0.01587302          0.04862541
19    brajnik g       1      5.7349335      0.01408451          0.02630014
20      ranon r       1      5.6619048      0.01190476          0.01849130
25  micheloni c       1      1.4761905      0.01234568          0.02680649
28      tasso c       1     20.1095367      0.01515152          0.04362959
4      dovier a       2     12.9590804      0.01298701          0.03419016
5   policriti a       2     63.0502603      0.01408451          0.06050805
7      piazza c       2      6.4073260      0.01298701          0.03356030
11     lancia g       2      0.0000000      0.01010101          0.01071465
12   pontelli e       2      0.3333333      0.01041667          0.02863919
13  formisano a       2      0.0000000      0.01030928          0.02261280
1   montanari a       3    149.7373916      0.01785714          0.06829667
14       sala p       3      7.6666667      0.01369863          0.03925775
15  sciavicco g       3     65.6352227      0.01587302          0.03266792
21      peron a       3      3.9833333      0.01298701          0.03335311
22   bresolin d       3      0.0000000      0.01315789          0.02139253
23    gigante n       3     11.9320095      0.01449275          0.03294865
24   bozzelli l       3      0.0000000      0.01219512          0.02150901
27     geatti l       3     29.4044085      0.01470588          0.02748925
3     mizzaro s       4     26.0528726      0.01315789          0.04851419
16    roitero k       4      5.2903123      0.01190476          0.03181247
26  della mea v       4      6.2093599      0.01176471          0.03215018
29  demartini g       4      5.2903123      0.01190476          0.03181247
30  maddalena e       4      0.0000000      0.00990099          0.02643640


Main statistics about the network

 Size                                  1012 
 Density                               0.009 
 Transitivity                          0.555 
 Diameter                              7 
 Degree Centralization                 0.116 
 Average path length                   3.772 
 

Densità: rete molto sparsa.

Transitività: livello di clustering elevato.

Centralizzazione del grado: distribuzione dei gradi non è completamente uniforme, con alcuni autori che hanno un numero di collegamenti significativamente maggiore rispetto ad altri.

Lunghezza media dei percorsi: molto breve.

Analisi Paesi

Rete Paesi

Grafo bipartito Papers x Paesi autori

         ITALY            USA UNITED KINGDOM          SPAIN      AUSTRALIA 
          1244            125             64             58             44 

Quasi la totalità degli autori proviene dall’Italia / ha pubblicato quando si trovava in Italia.

Collaborazione tra Paesi

Vediamo che l’Italia è il paese con il grado più alto, il che indica che è il Paese con il maggior numero di collaborazioni all’interno della rete. Seguono USA, UK e Spagna.

                                     node       degree
italy                               italy 1.0000000000
usa                                   usa 0.1472312704
united kingdom             united kingdom 0.0824104235
spain                               spain 0.0723127036
australia                       australia 0.0557003257
france                             france 0.0517915309
denmark                           denmark 0.0413680782
switzerland                   switzerland 0.0361563518
germany                           germany 0.0348534202
finland                           finland 0.0224755700
canada                             canada 0.0175895765
netherlands                   netherlands 0.0166123779
iceland                           iceland 0.0153094463
south africa                 south africa 0.0136807818
sweden                             sweden 0.0127035831
turkey                             turkey 0.0117263844
hong kong                       hong kong 0.0117263844
new zealand                   new zealand 0.0097719870
portugal                         portugal 0.0094462541
czech republic             czech republic 0.0091205212
israel                             israel 0.0081433225
macedonia                       macedonia 0.0078175896
romania                           romania 0.0068403909
austria                           austria 0.0061889251
serbia                             serbia 0.0061889251
poland                             poland 0.0058631922
belgium                           belgium 0.0058631922
japan                               japan 0.0055374593
china                               china 0.0048859935
india                               india 0.0048859935
north macedonia           north macedonia 0.0045602606
ireland                           ireland 0.0045602606
lithuania                       lithuania 0.0045602606
slovenia                         slovenia 0.0035830619
united arab emirates united arab emirates 0.0032573290
chile                               chile 0.0029315961
saudi arabia                 saudi arabia 0.0029315961
greece                             greece 0.0026058632
iran                                 iran 0.0026058632
korea                               korea 0.0026058632
bulgaria                         bulgaria 0.0016286645
egypt                               egypt 0.0013029316
hungary                           hungary 0.0009771987
mexico                             mexico 0.0009771987

Rete storica delle citazioni dirette

La mappa storiografica è un grafo proposto da E. Garfield (2004) per rappresentare una mappa di rete cronologica delle citazioni dirette più rilevanti risultanti da una raccolta bibliografica.

Vediamo una citazione da un articolo di Kevin Roitero, PhD del 2020 ad un articolo del Professor Mizzaro del 2007, più una serie di citazioni tra articoli dei Professori Molinari/Montanari/Bresolin tra il 2016 e il 2003.

Analisi parole chiave

Rete parole chiave

Rete Bipartita Papers x Keyword Scopus

Ogni paper ha associate delle parole chiave dal database di Scopus.

Word cloud

Dai dati della rete bipartita è possibile creare un df con le frequenze delle parole, da cui si può ricavare una word cloud.

Le tre parole più presenti sono Computer Circuits (121), Semantics (99) e Logic Programming (96).

Rete co-occorrenze parole chiave

Ci sono quattro cluster di parole chiave:

  • ognuno contiene parole di diversi campi di ricerca

  • il primo cluster presenta la btw_centrality media più alta; può significare che le parole sono concetti chiave in diverse discipline informatiche. Inoltre, la posizione centrale del cluster 1 nella rete di co-occorrenza suggerisce che funge da ponte tra diverse aree dell’informatica.

  • nel terzo cluster, la parola “computation theory” ha il valore di betwenness e closeness più alto; potrebbe fungere da concetto chiave che collega diverse aree dell’informatica teorica.

  • nel quarto cluster è presente la parola “problem solving” che ha il valore più alto di btw_centrality, suggerendo che potrebbe essere un concetto chiave che collega l’intelligenza artificiale e l’informatica con campi applicativi che richiedono la soluzione di problemi.

                           vertex cluster btw_centrality clos_centrality
6           information retrieval       1     19.5440476      0.02127660
8                      algorithms       1     12.9112554      0.02083333
12                virtual reality       1     18.6545455      0.02000000
17                 mobile devices       1     71.5831169      0.02380952
19            computer simulation       1     47.1402597      0.02272727
20                  deep learning       2      1.0833333      0.01369863
23                          human       2      0.2500000      0.01666667
24                         humans       2      2.1166667      0.01724138
25                        article       2     14.5251082      0.01886792
1               computer circuits       3      0.0000000      0.01388889
2                       semantics       3      0.5928571      0.01538462
3               logic programming       3     18.3980519      0.01639344
4                  temporal logic       3      2.8190476      0.01612903
7                 automata theory       3      3.7159091      0.01666667
9  computability and decidability       3     10.3902597      0.01754386
10                 model checking       3      1.7083333      0.01639344
13                   formal logic       3      0.4837662      0.01515152
14             computation theory       3     29.0920996      0.02000000
15 computer programming languages       3      3.3187229      0.01960784
21                        algebra       3      0.8333333      0.01388889
22                   calculations       3      7.7143939      0.01724138
5         artificial intelligence       4      5.2016234      0.01851852
11               computer science       4     22.4591991      0.01923077
16                problem solving       4     28.2877706      0.02127660
18            mathematical models       4      6.1202381      0.01886792
   pagerank_centrality
6           0.02312126
8           0.04849195
12          0.01642496
17          0.01835430
19          0.03406490
20          0.01221384
23          0.03684086
24          0.03437656
25          0.03018056
1           0.08820886
2           0.06530626
3           0.05627130
4           0.07092624
7           0.04178205
9           0.04372405
10          0.04777148
13          0.04409430
14          0.04036151
15          0.03986053
21          0.03245140
22          0.02372588
5           0.05125958
11          0.03355208
16          0.03360397
18          0.03303133

Mappa tematica

L’analisi di co-occorrenza delle parole chiave genera cluster tematici, la cui densità e centralità permettono di classificarli e mapparli in un diagramma bidimensionale, creando una mappa tematica.

Essa consente di analizzare i temi in base al quadrante in cui sono collocati:

  1. quadrante in alto a destra: temi motori (cluster molto denso e molto centrale);

  2. quadrante in basso a destra: temi di base (cluster poco denso ma molto centrale);

  3. quadrante in basso a sinistra: temi emergenti o in via di estinzione (cluster poco denso e poco centrale);

  4. quadrante in alto a sinistra: temi molto specializzati/di nicchia (cluster molto denso e poco centrale).

La colonna r.rel si riferisce alle frequenze relative delle parole all’interno del cluster di appartenenza.

Ad esempio, il cluster in cui spicca la parola “algorithms” è nel quadrante dei temi di base, mentre “crowdsourcing” si trova nel quadrante dei temi emergenti o in declino. Il cluster con “finite element method” si trova nel quadrante dei temi di nicchia.

# A tibble: 45 × 4
# Groups:   Cluster [9]
   Cluster Words                      Occurrences  n.rel
     <dbl> <chr>                            <dbl>  <dbl>
 1       1 algorithms                          63 0.0740
 2       1 computer simulation                 37 0.0435
 3       1 deep learning                       31 0.0364
 4       1 database systems                    30 0.0353
 5       1 computers                           28 0.0329
 6       2 information retrieval               71 0.0810
 7       2 virtual reality                     53 0.0604
 8       2 mobile devices                      46 0.0525
 9       2 user interfaces                     38 0.0433
10       2 human computer interaction          37 0.0422
# ℹ 35 more rows

Conclusione

All’interno del dipartimento operano gruppi di ricerca che si distinguono per una notevole produttività scientifica, la quale si traduce in un significativo apporto alla letteratura di settore. Pur focalizzandosi su ambiti di ricerca differenti, i gruppi collaborano attivamente tra loro, favorendo lo scambio di conoscenze e competenze.

Aria, Massimo, and Corrado Cuccurullo. 2017. “Bibliometrix: An r-Tool for Comprehensive Science Mapping Analysis.” Journal of Informetrics 11 (4): 959–75. https://doi.org/10.1016/j.joi.2017.08.007.

  1. Tutte le nozioni viste a lezione sono utilizzate ma non ri-definite.↩︎